#eficiencia computacional

SAGE: Puerta de Novedad para Evolución Eficiente de Memoria en LLMs Agénticos

Descubre SAGE, el innovador gate que optimiza la memoria de LLMs agenticos: reduce costos de API 3.4x y latencia 2.5x manteniendo calidad.

2026-06-01 · 3 min

Escalando aprendizaje de grafos de alto orden con complejos de cliques maximales

Descubre cómo los complejos de cliques maximales escalan el aprendizaje de grafos de alto orden con mayor eficiencia y sin perder expresividad.

2026-06-01 · 2 min

Hermes: razonamiento matemático eficiente y verificable en LLMs

Descubre Hermes: agente que combina razonamiento informal y verificación formal en Lean para mejorar precisión matemática en LLMs un 40% con 80% menos coste.

2026-06-01 · 1 min

DTop-p MoE: Control dinámico de esparcidad en preentrenamiento de modelos

Descubre DTop-p MoE, un nuevo mecanismo de enrutamiento dinámico que aprende el umbral de probabilidad para controlar la esparcidad, superando a Top-k y Top-p fijo en modelos fundacionales.

2026-06-01 · 2 min

MedCoG: Maximizando la densidad de inferencia de LLM en razonamiento médico

MedCoG optimiza el razonamiento médico de LLM con metacognición, logrando 6.2x más densidad de inferencia. Reduce costos y mejora precisión.

2026-06-01 · 1 min

PRISM: Selección Intrínseca de Datos Multimodales sin Entrenamiento

Descubre PRISM, un método que selecciona datos de instrucción visual sin entrenamiento, reduciendo costes y mejorando el rendimiento de modelos multimodales.

2026-06-01 · 2 min

Autovectores de expertos: enrutamiento sin colapso y sin entrenamiento

Descubre cómo SSMoE aprovecha los autovectores de los expertos para un enrutamiento sin colapso, mejorando modelos SMoE sin entrenamiento adicional.

2026-06-01 · 2 min

Condensación eficiente y escalable de grafos con preservación de estructura

Conoce SP-ESGC: método eficiente y escalable para condensar grafos preservando estructura. Mejora generalización y reduce costos computacionales.

2026-06-01 · 2 min

Modelado de series temporales multiescala generalizado con un solo operador

Descubre cómo SiGMA generaliza el modelado multiescala de series temporales con un solo operador, logrando 5.3x más velocidad y 3.8x menos memoria.

2026-06-01 · 3 min

DG-CoLearn: Un marco eficiente de aprendizaje colaborativo para grafos dinámicos

Descubre DG-CoLearn: acelera hasta 33.8x el aprendizaje en grafos dinámicos con privacidad estructural y mejora del 13% en precisión.

2026-06-01 · 2 min

DRIFT: Optimización eficiente de modelos de lenguaje en múltiples turnos

DRIFT optimiza modelos de lenguaje en múltiples turnos con eficiencia de SFT y rendimiento de RL. Descubre cómo.

2026-06-01 · 2 min

¿Es suficiente la última capa para cuantificar la incertidumbre?

Descubre por qué la linearización de la última capa ofrece una cuantificación de incertidumbre comparable a la de toda la red, con mucha mayor eficiencia computacional. Estudio teórico y empírico.

2026-06-01 · 2 min

S3LDBO: Algoritmo de bucle único con instantáneas para optimización descentralizada

Descubre S3LDBO, algoritmo de optimización bilevel descentralizada que reduce cómputo con instantáneas, mejorando eficiencia en redes de IA.

2026-06-01 · 1 min

OddSHAP: El estimador impar de Shapley

OddSHAP revoluciona la estimación de valores Shapley. Al aislar el componente impar, logra una precisión superior en atribución de ML. Descubre el nuevo benchmark.

2026-06-01 · 2 min

Modelos pequeños: exploradores naturales para diversidad en GRPO

Descubre cómo los modelos pequeños mejoran la diversidad en GRPO y entrenan modelos grandes con mayor eficiencia. Aumenta el rendimiento en razonamiento matemático.

2026-06-01 · 2 min

ConMoE: Consolidación del grupo de expertos mediante reasignación de prototipos para la compresión de MoE

ConMoE: consolidación de grupos de expertos con reasignación de prototipos para compresión de MoE. Descubre cómo comprimir modelos MoE optimizando eficiencia y rendimiento.

2026-05-30 · 1 min